Loading...
机构名称:
¥ 2.0

摘要。数据增强 (DA)——通过添加合成样本来丰富训练数据——是计算机视觉 (CV) 和自然语言处理 (NLP) 任务中广泛采用的一项技术,用于提高模型性能。然而,DA 在网络环境中一直难以获得关注,特别是在流量分类 (TC) 任务中。在这项工作中,我们通过对应用于 3 个 TC 数据集的 18 个增强函数进行基准测试来填补这一空白,使用数据包时间序列作为输入表示并考虑各种训练条件。我们的结果表明:(i) DA 可以获得以前未曾探索过的好处;(ii) 作用于时间序列顺序和掩蔽的增强比幅度增强更适合 TC;(iii) 基本模型潜在空间分析有助于理解增强对分类性能的正面/负面影响。

arXiv:2401.10754v2 [cs.LG] 2024 年 1 月 23 日

arXiv:2401.10754v2 [cs.LG] 2024 年 1 月 23 日PDF文件第1页

arXiv:2401.10754v2 [cs.LG] 2024 年 1 月 23 日PDF文件第2页

arXiv:2401.10754v2 [cs.LG] 2024 年 1 月 23 日PDF文件第3页

arXiv:2401.10754v2 [cs.LG] 2024 年 1 月 23 日PDF文件第4页

arXiv:2401.10754v2 [cs.LG] 2024 年 1 月 23 日PDF文件第5页

相关文件推荐

2024 年
¥1.0